10. 心理学的な「ものさし」をつくる
https://gyazo.com/93a402d72f37170c3763894b196d1a0b
1. 心理学と構成概念
誰もが「あること」を認めるが「とらえどころがない」実体
心理学では「データ」を得るためには観察対象に対して適切な働きかけ(教示や質問紙の提示)をし、相手がそれを何らかの形で表象し、その表象されたものが適切に表出されなければならない
既存のものさしが存在しないので、「ものさし」作りそのものが重要
心理学心理学的構成概念を測るに相応しいツールを作っていくこと
2. 尺度構成の過程
構成概念の吟味
項目の採集
予備調査表の完成・実施
弁別力の分析(項目の精選)
信頼性の確認
妥当性の検討
2-1. 構成概念の吟味
生徒の自尊心の高さを「自尊感情」という概念で現すこととする
最初にやるべきことは、この概念の持つさまざまな意味の吟味
「自尊」
自分を尊重すること
自分に価値を見出すこと
自分を悪く思わないこと
必ずしも他者と比較して「いい」とか思わないこと
その概念の外延(事例)と内包(特徴)を徹底的に吟味していく
こうした構成概念のように、直接には観察不能なもの
その概念が存在する場合に、具体的に事例およびその特徴として現れる、観察可能な行動や感情や認知の側面
こうした観測変数(項目)を取り出していくことが次の段階
2-2. 項目の採集と回答形式の決定
観測変数としての項目の採集にはさまざまな資源がある
自分自身の経験や知見から、それが観測可能な形でどのように表れるかを十分に吟味すること
それを同僚・仲間で出し合い吟味することも重要
関連すると思われる既成の尺度で用いられている項目の一部を援用すること
その場合は引用元の研究者に対して断りを入れておく必要がある
当該の構成概念に関連した、近い概念をも想定し、そこから出てくる観測変数を個人・仲間うちで出し合っていくこと
次に、候補となった項目の表現形式の吟味が重要となる
わかりやすく明瞭に
ダブルコーディングをしないこと
量子化(「かなり」とか「すごく」等)や抽象概念を避けること
調査を受ける側に調査の意図を悟らせないために、あえて潜在変数とは逆の形で表れると想定される項目(逆転項目)を設定しておくことも重要
この段階ではいくぶん冗長なくらいの項目数が要求される
以後の分析で、項目数は減ることはあっても増えることはない
項目が決定したら、それに対してどのような回答を期待するかに基づいて回答の形式を決めなければならない
「いいえ」から「はい」に至る尺度を心理的連続変量ととらえ、各種統計に必要な適切な分散を確保するためには3~5件法での回答の形式が望まれる
2-3. 予備調査表の完成・実施
項目と回答形式が定まったら、この暫定的な質問項目を精選していくための予備的な調査をすることが望まれる
あらかじめ、既存の心理尺度から、当該の構成概念測定にきわめて近いと思われる尺度を選択し、ともに1つの質問紙の中に入れておくことが望まれる
予備調査では、当該の構成概念のもとで作成・採集された各項目と、以後、ここで構成された尺度の構成概念妥当性を確認するため 当該の構成概念がかなりたくさんの下位因子を想定し、トータルの質問項目が多大になって被調査者に負担が大きいと思われる場合には妥当性検討は別の機会にすべき
予備調査にあたっては、項目の総数以上の被調査者(できれば300-400名(芝, 1991))を確保し、その被調査者は、作成する心理尺度を実際に適用しようとする群と同等であることが望ましい 次に調査票が回収されたあとは、有効被調査者の確定に入る
右ばかり、左ばかりなど
2-4. 項目の精選
上記の手続きで採集してきた項目は、その中のどの項目がより当該の構成概念を代表したもの、構成概念の内容の豊かさを反映されたものであるかは不明
明らかなことは、たとえば5件法で400名に実施したところ、ある項目は全員が1点、あるいは5点であった場合、その項目は当該の構成概念に対して弁別力を持たないこと
現在では、コンピュータ利用が当然のこととなり、こうした項目の精選過程についても統計パッケージ(たとえばIBM社のSPSSなど)を利用して、因子分析の手法を併用しながら比較的容易に行うことができるようになっている
1. 項目の採集
「卒論に対する態度」という構成概念を、卒論に取り組む大学生の「認知・行動・情動」の3側面から構成される「態度」ととらえ(構成概念の吟味)、それに関連すると考えられる13の先行研究を選定し、卒論への態度の測定に適用可能と考えられる349項目を採集した
次に、採集された項目内容が卒論の文脈に通じない項目および意味内容が重複する項目を除外し102項目を抽出
「卒論」や「卒論指導」という文言を加えたりして項目内容の意味が通じるようにして、書式を統一し、これらの接頭語を加えたことで適切な項目にならないと判断された項目を削除した
以上の手続きにより、92項目からなる仮の尺度を作成
この92項目のうち、3項目を反応歪曲(response set)検出のために再度配置し、合計95項目の質問紙とした
2. 予備調査の実施・被調査者/分析項目の確定
大阪府下2大学計492名の大学生に実施し、因子分析を用いながら項目を精選
有効な被調査者の確定
卒論を書くことが卒業の必修条件になっていることが前提とされており、そうではない学生および明らかな反応歪曲があったものを除いた398名のデータを有効データと確定した
天井効果: ある項目に対する可能な範囲の反応のうち、すべてがその最高点になってしまう場合
床効果: すべてが可能な範囲の最低点であった場合
以上の操作により84項目398名のデータを因子分析することとした 3. 因子分析と項目精選の過程
84項目398名のデータについて、その因子構造を探索的に探るために以下の分析を行った
因子数の探索
6因子の構造の探索
上記の結果から各因子の負荷0.4以上の合計50項目について、再度因子数指定なしで検討した結果、5因子構造が適切であると判断されるスクリープロットが得られた
したがって、因子は5因子で構成されることを確定した
5因子構造の探索
5因子に指定した50項目について因子分析を繰り返し、すべての因子負荷が0.4以上になるまで不適切な項目を削除しながら探索を続けた
その結果、45項目5因子で構成される尺度が作成された
これを、以下に述べる「信頼性の確認」手順のなかでさらに精選をし、最終的に41項目からなる「SAG41」尺度が構成された 田中・山田(2011)では、これを大学のWeb上での自己診断ツールとすべく、さらに項目の精選を進め、5因子各5項目計25項目からなる「SAG25」尺度を公表した ここでの項目の精選過程は、心理学研究も社会的営為の1つであることを考えたとき(自己診断の利便性を優先した構成)の1つの選択の道であると考えられる
2-5. 信頼性の確認
何度繰り返しても一貫した安定的な値が得られる傾向
測定する対象の真の値の分散と測定した値の分散の比で現すことができ
$ 信頼性係数 = \frac{真値の分散}{測定値の分散(真値の分散+誤差分散)}
測定は1回であるのに、その測定に複数の項目が含まれている場合の信頼性の定義もある
複数の項目が一貫して同じものを測っているという意味での信頼性であり、内的整合性と言い換えることもできる その概念を構成する観測変数である各項目の特典の分散を合計したもの($ \Sigma \sigma_i^2)と、項目合計数点の分散($ \sigma^2)の比を中心に表したもの
前者が後者に比べて大きければ大きいだけα係数は小さくなる
$ a = \frac{n}{n-1}(1-\frac{\Sigma \sigma_i^2}{\sigma^2})
これをもっと簡単に示せば、項目数($ n)と項目間の相関係数の平均($ \bar{r})で
$ a = \frac{n\bar r}{1+\bar r(n-1)}
2-6. 妥当性の検討
2-6-1. 妥当性の意味
ある測定道具がどの程度測ろうとしているものを適切に測っているか
本来は、理論的に予測される値と現実場面で測定される値は等しくなければならず、これが妥当性のある尺度の要件となるが、誤差によって尺度の妥当性は影響を受ける
測定の状況に応じて物理学的な「真」の値が、実際の測定では得られないような場合
状況とは関係なく、そのものさしそのものが壊れている場合
信頼性の低いものさしはランダム誤差が大きく、したがって妥当性も低くなる
逆に、ものさしそのものが壊れている場合、いくら繰り返し測定しても常に理論的な属性の値と現実の測定の値は大きくズレることになり、両方の値が一致することはありえない
妥当性のなさは非ランダム誤差から生まれる
2-6-2. 妥当性検討の方法
心理尺度を構成する前に行う
たとえば、「国語の力」という構成概念の示す内容を「漢字の読みができるか」だけで見ていこうとすることには内容的な妥当性が欠けている
こうした内容的妥当性は、その概念の内容を熟知した専門家らによってチェックされる事が多い
一方で、構成した尺度の妥当性を、実際にその尺度を対象に当てはめて、経験的に得られたデータから語っていく方法もある
その構成概念から生まれた観測変数の値が、その構成概念をより直接的に反映していると考えられる外部の基準と関連しているかどうかによって妥当性を定義する
たとえばSAG25がもっと明確に「卒論へのやる気とその成果についての尺度」だとすれば、「立派な論文を書いた」という外部基準(評定点)とこの尺度の評定点に高い相関が見られた場合、この尺度は基準関連妥当性がある
尺度が後のパフォーマンスを正しく予測していることを示す
同じ時期の関連するある種のパフォーマンスが得られ、それとの強い相関が見られた場合
理論的に予測される値と現実場面で測定される値の関係を、その構成概念から取り出した観測変数でできた尺度の得点と、その構成概念の中に含まれると想定される「他の尺度」の得点とがどの程度関係しているかで検討
構成概念妥当性の検討には、構成した当該の尺度と、その背景にあった構成概念で示唆される別の尺度(キオsンの、同一構成概念から理論的に導き出される異なった尺度)が同時に同一被調査者に実行され、その相関の高さが吟味される
そこで高い相関が見られれば、これら異なる尺度は同じ構成概念を測っているとみなされ、当該の尺度は収束的証拠を持つ,とされる 逆に相対的に小さな相関係数しか得られない場合は、識別的証拠を持つ、とされる 3. 尺度構成と心理学研究
『心理測定尺度集』